ارائه یک روش خلاصه ساز خودکار متون فارسی به روش معنایی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده برق و کامپیوتر
- نویسنده فراز محمدیان جدول قدم
- استاد راهنما احمد رضا نقش نیلچی محمد علی نعمت بخش
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1391
چکیده
خلاصه سازی خودکار متن یکی از جنبه های مهم در بازیابی اطلاعات می باشد. در این پایان نامه یک روش جدید برای خلاصهسازی خودکار متون فارسی پیشنهاد شده است که رویکردی مبتنی بر معنا دارد. روش پیشنهادی، دارای سه فاز پیش پردازش، پردازش و تولید خلاصه نهایی می باشد. در مرحله پیش پردازش، ریشه کلمات با استفاده از یک روش مبتنی بر فرهنگ واژگان بدست می آید. مجموعه ترادف جملات موجود در متن از طریق همین فرهنگ واژگان بدست می آید. این کار منجر به یک زنجیره لغوی قوی می شود. در مرحله پردازش، با استفاده از زنجیره لغوی و روش تحلیل معنای پنهان، ارتباط بین جملات مهم بدست می آید تا جملات مرتبط با هم گزینش و در خروجی قرار گیرند. در مرحله تولید خلاصه، برای رفع افزونگی و تکرار، جملات مشابه در خروجی با جملات انتخاب شده مقایسه شده و در صورت داشتن شباهت نسبی (با انتخاب ضریب میزان تشابه 80?) از قرار دادن آن در خلاصه نهایی جلوگیری می شود. دو شیوه برای ارزیابی خلاصه ساز پیشنهادی ارائه شده است. یکی روش ارزیابی مستقیم و دیگری روش ارزیابی مبتنی بر lsa (تحلیل معنایی پنهان) است. نتایج ارزیابی نشان می دهد به دلیل استفاده از فرهنگ واژگان غنی، ریشه یابی با دقت بالائی انجام می گیرد که در مقایسه با روش های مشابه کارایی بالائی دارد. به دلیل استفاده از همین فرهنگ واژگان غنی، مجموعه ترادف و زنجیره لغوی ارتباط معنای کلمات و جملات در روش تحلیل معنایی پنهان بسط داده شده به درستی بدست آورده می شود که نتایج حاکی از این امر دارد. در نهایت نتایج ارزیابی نشان می دهد که روش ارائه شده خلاصه قابل قبول و منسجمی ارائه می دهد.
منابع مشابه
سیستم خودکار خلاصه ساز متون فارسی
دراین پژوهش روشی ترکیبی از الگوریتم ژنتیک و شبکه عصبی rbf برای خلاصه سازی استخراجیِ متون فارسی پیشنهاد شده است، که ابتدا به امتیازدهی پاراگراف ها پرداخته می شود، سپس پاراگراف های برتر را انتخاب کرده و به محاسبه امتیاز جملات آن ها می پردازد. همچنین جهت تعیین میزان اهمیت هر یک از ویژگی های جملات از یک شبکه عصبی mlp بهره گرفته شده است. سپس با استفاده از یک شبکه عصبی rbf به گزینش جملات برتر به عنوان...
ارائه مدلی جدید جهت خلاصه سازی خودکار متون فارسی با رویکرد معنایی و استخراجی
خلاصه سازی خودکار متون به فرایندی اطلاق می شود که طی آن یک متن بزرگ، ضمن رعایت شرایطی، به متنی با حجم کمتر تبدیل می شود. تاکنون رویکردهای متعددی جهت خلاصه سازی ارائه شده است. در این پایان نامه، ضمن بررسی روش های موجود جهت خلاصه سازی خودکار متون، روش جدیدی با استفاده از رویکردهای مبتنی بر گراف، جهت خلاصه سازی متون فارسی ارائه شده است. در این روش جملات متن ورودی، در یک گراف کامل مدل شده و پس از ت...
15 صفحه اولارائه سیستم خلاصه ساز متون فارسی برمبنای ویژگی های زبان شناختی و رگرسیون
Considering the vast amount of existing written information and the shortage of time, optimal summarization of books, articles, news reports, etc. on the Web is a major concern of researchers. In this paper, we propose a new approach for Persian single-document Summarization based on several linguistic features of text. In our approach after extracting the linguistic features for each sentence,...
متن کاملارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون
Nowadays summarizers and machine translators have attracted much attention to themselves, and many activities on making such tools have been done around the world. For Farsi like the other languages there have been efforts in this field. So evaluating such tools has a great importance. Human evaluations of machine summarization are extensive but expensive. Human evaluations can take months to f...
متن کاملارائه یک روش مبتنی بر گرایش معنایی برای طبقهبندی چندبرچسبی محتوای فیلمها بهکمک متون زیرنویس آنها
پیبردن به محتوای تصاویر متحرک و ژانر آنها، همواره امری پیچیده و مسئلهای باز برای پژوهشگران بوده است. فعالیتهای متعددی توسط پژوهشگران برای پیبردن به محتوای فیلمها انجام پذیرفته است. اکثر فعالیتهای صورتگرفته در این زمینه با استفاده از پردازش صوت یا تصویر فیلمها بوده است. اخیراً گروهی از پژوهشگران ایده استفاده از متون زیرنویس فیلمها را برای پیبردن به محتوای فیلمها مطرح نموده و پردازش مت...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه اصفهان - دانشکده برق و کامپیوتر
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023